هزيمة العمالقة- الذكاء الاصطناعي Pluribus يسحق محترفي البوكر
09.10.2025

يهدد روبوت ذكاء اصطناعي (AI) آخر يتمتع بقدرات "خارقة" مصير لاعبي البوكر في كل مكان.

بعد عقدين من التطوير، يمكن لبرامج البوكر التي تعمل بالذكاء الاصطناعي الآن التغلب على ألعاب No Limit Hold’em متعددة اللاعبين.
وصف توماس ساندولم، كبير المطورين، أداء Pluribus الأخير بأنه إنجاز كبير، حيث هزم مجموعة من اللاعبين العالميين.
الذكاء الاصطناعي ضد العديد من المحترفين
في عرض لأحدث معركة بين الإنسان والآلة في مجلة Science Mag، جمع ساندولم ونوام براون سيناريوهين.
شهد السيناريو الأول مجموعات من خمسة محترفين يواجهون نسخة واحدة من الكمبيوتر العملاق. وشهد السيناريو الآخر محترفين يواجهون طاولة من روبوتات البوكر التي تعمل بالذكاء الاصطناعي بشكل فردي.
من بين 13 محترفًا تم اختيارهم للعب في مباراة خمسة لاعبين/كمبيوتر واحد، كان جريج ميرسون. مع أكثر من 11 مليون دولار من الأرباح الحية وWSOP Main Event لعام 2012 باسمه، يعد ميرسون اختبارًا صعبًا لأي شخص.
ومع ذلك، بعد 10000 توزيع ورق و12 يومًا من اللعب، لم تتمكن حتى مهارات الأمريكي من هزيمة Pluribus. وفقًا للنتائج، حقق برنامج الذكاء الاصطناعي متوسط معدل فوز يبلغ 48 ملي بن كبير لكل لعبة (mbb/game).
مع تحقيق فوز واحد، دخل كريس فيرجسون الملقب بيسوع ودارين إلياس إلى المعركة. جلس كل منهما في مواجهة خمس نسخ من روبوت البوكر، وفعل المحترفون ما في وسعهم على مدار 10000 توزيع ورق.
لسوء حظ البشرية، لم تتمكن حتى جهود فيرجسون المقدسة من تأمين الفوز. على الرغم من أن الثنائي كان أداؤه أفضل، إلا أن Pluribus لا يزال يحقق معدل فوز إجمالي يبلغ 32 mbb/game.
خمس حقائق مخيفة: ما تعلمناه من Men vs. Pluribus
- في عام 2017، تم تشغيل Libratus بواسطة 100 وحدة معالجة مركزية. في عام 2019، احتاج Pluribus إلى وحدتين فقط.
- يستخدم Pluribus أقل من 128 جيجابايت من الذاكرة، مما يعني أنه يمكن تشغيله على خادم سحابي يكلف أقل من 150 دولارًا.
- يستغرق Pluribus في المتوسط 20 ثانية لكل توزيع ورق في إعداد متعدد اللاعبين أو ضعف سرعة اللاعب البشري العادي.
- Pluribus معلم ذاتي بالكامل. بعد برمجة قواعد No Limit Texas Hold’em، تركها المطورون لتعلم واستنباط استراتيجياتها الخاصة.
- على الرغم من أن Pluribus لديه مخطط للعب الأمثل في بداية اللعبة، إلا أنه يجري عمليات بحث في الوقت الفعلي في قاعدة بياناته ويمكنه التكيف بناءً على تحركات خصومه.
روبوت بوكر معلم ذاتي
قبل مواجهة العديد من اللاعبين في وقت واحد، لعب برنامج الذكاء الاصطناعي تريليونات الأيدي ضد نفسه. باستخدام تقنية تعرف باسم "التعلم المعزز"، وصل إلى مستوى عالمي في 20 ساعة فقط.
في حين أن هذه الحقيقة مثيرة للإعجاب بما يكفي، قال ساندولم إن قدرة البرنامج على هزيمة العديد من اللاعبين في وقت واحد تجاوزت التوقعات.
على الرغم من أن مشروعه السابق Libratus أثبت أن روبوتًا واحدًا يمكن أن يهزم لاعبًا واحدًا، إلا أن مهمة هزيمة خمسة عقول بوكر كبيرة كانت أكثر صعوبة بشكل ملحوظ.
ومع ذلك، بعد 12 يومًا من المراهنة والخداع، أصبح المطورون الآن واثقين من أن الذكاء الاصطناعي لا يمكن أن يزدهر في البوكر فحسب، بل في العالم الحقيقي أيضًا.
في رأيهم، فإن القدرة على وضع استراتيجيات ضد العديد من المعارضين يمكن أن تساعد في مجالات مثل الأمن السيبراني والرعاية الصحية والمالية.
يقدم Pluribus بعض الإيجابيات للاعبين
بالنسبة للاعبي البوكر، تعد الهزيمة الأخيرة علامة مشؤومة محتملة. ومع ذلك، هناك بعض الإيجابيات.
من منظور استراتيجي، يمكن لتكتيكات Pluribus أن تحيي رهان الحمار الوحشي. غالبًا ما ينتقده الخبراء، وقد يكون فعل الاتصال بالرفع والمراهنة على الرافع في الشارع التالي أكثر فعالية مما كان يعتقد في البداية.
سبب توصل الروبوت إلى هذا الاستنتاج غير واضح. ومع ذلك، فقد قام بهذه الخطوة "في كثير من الأحيان" خلال مبارياته أكثر من المحترفين.
أكد Pluribus أيضًا أن العرج هو استراتيجية ضعيفة. على الرغم من أنه جرب في البداية هذه الخطوة خلال مرحلة التعلم، إلا أن البرنامج قرر في النهاية أن الرفع أو الطي كان الأمثل.
في حين أننا قد لا نكون على شفا سيطرة الذكاء الاصطناعي، فقد يكون الوقت ينفد. في عام 2017، أشارت الأبحاث التي أجرتها MatchPoker إلى أن No Limit Hold’em لا يزال معقدًا جدًا بحيث لا يمكن للذكاء الاصطناعي حله.
بالتقدم السريع لمدة عامين، يثبت Pluribus أن هذه النظرية خاطئة. والأكثر من ذلك، أن البرنامج يعمل على خادم سحابي يكلف تشغيله 144 دولارًا فقط.
في تلخيص أحدث النتائج، يعترف ساندولم وبراون بأن الذكاء الاصطناعي بعيد عن الكمال. ومع ذلك، حتى في بيئات المعلومات غير الكاملة المعقدة، يمكن للتكنولوجيا الحالية أن تنتج استراتيجيات "خارقة".